AI资讯新闻榜单内容搜索-DeepSeek v

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: DeepSeek v
超越DeepSeek V3!Ai2再祭开源杀器Tülu 3,强化学习打破性能瓶颈

超越DeepSeek V3!Ai2再祭开源杀器Tülu 3,强化学习打破性能瓶颈

超越DeepSeek V3!Ai2再祭开源杀器Tülu 3,强化学习打破性能瓶颈

2024年11月,艾伦人工智能研究所(Ai2)推出了Tülu 3 8B和70B,在性能上超越了同等参数的Llama 3.1 Instruct版本,并在长达82页的论文中公布其训练细节,训练数据、代码、测试基准一应俱全。

来自主题: AI技术研报
6185 点击    2025-02-05 16:54
阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏

阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏

阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏

昨晚,杭州大模型又双叒不睡,给大伙儿拜年啦~就在春晚直播进行时,阿里通义Qwen发布新春节礼第三弹:Qwen2.5-Max来袭,多个基准测试中超越当红炸子鸡DeepSeek V3。

来自主题: AI资讯
5893 点击    2025-01-29 12:40
Atom Capital:中美AI最前沿——创投新趋势、中美竞争与初创企业出海战略

Atom Capital:中美AI最前沿——创投新趋势、中美竞争与初创企业出海战略

Atom Capital:中美AI最前沿——创投新趋势、中美竞争与初创企业出海战略

2024又是AI精彩纷呈的一年。LLM不再是AI舞台上唯一的主角。随着预训练技术遭遇瓶颈,GPT-5迟迟未能问世,从业者开始从不同角度寻找突破。以o1为标志,大模型正式迈入“Post-Training”时代;开源发展迅猛,Llama 3.1首次击败闭源模型;中国本土大模型DeepSeek V3,在GPT-4o发布仅7个月后,用 1/10算力实现了几乎同等水平。

来自主题: AI资讯
7536 点击    2025-01-19 10:38
最强代码模型刷新:Mistral新品上线即登顶,上下文窗口增至256k

最强代码模型刷新:Mistral新品上线即登顶,上下文窗口增至256k

最强代码模型刷新:Mistral新品上线即登顶,上下文窗口增至256k

“欧洲版 OpenAI” Mistral 的代码模型 CodeStral,又上新了! 而且与 DeepSeek V2.5 和 Claude 3.5 平起平坐,共同位列 Copilot 竞技场第一名。

来自主题: AI资讯
7137 点击    2025-01-14 15:42
DeepSeek官方App上线!功能完整且免费,网友:ChatGPT最佳替代品

DeepSeek官方App上线!功能完整且免费,网友:ChatGPT最佳替代品

DeepSeek官方App上线!功能完整且免费,网友:ChatGPT最佳替代品

太好了!DeepSeek有App了,我们有救了!(doge) 现在,官方应用上线App Store,背后正是由此前火爆全网的“国产之光”DeepSeek V3模型提供支持。

来自主题: AI资讯
9724 点击    2025-01-13 14:46
再见Cursor! Cline+DeepSeek-V3 双雄组合引爆AI编程| 最强配置方案+代码实例

再见Cursor! Cline+DeepSeek-V3 双雄组合引爆AI编程| 最强配置方案+代码实例

再见Cursor! Cline+DeepSeek-V3 双雄组合引爆AI编程| 最强配置方案+代码实例

还在为每个月20美元的Cursor订阅费发愁吗?还在担心代码被上传到国外服务器?今天给大家介绍一个既省钱又安全的神器组合 - Cline+DeepSeek V3。

来自主题: AI资讯
13287 点击    2025-01-02 17:11
DeepSeek V3获竞技场最强开源认证!与Claude 3.5 Sonnet对比实测来了

DeepSeek V3获竞技场最强开源认证!与Claude 3.5 Sonnet对比实测来了

DeepSeek V3获竞技场最强开源认证!与Claude 3.5 Sonnet对比实测来了

国产之光DeepSeek V3竞技场排名新鲜出炉—— 优于o1-mini(总榜第7),获最强开源模型认证(也是唯一闯入前10的开源模型)。

来自主题: AI资讯
6529 点击    2024-12-31 14:49
“训练数据抄袭”:DeepSeek 动了谁的奶酪?

“训练数据抄袭”:DeepSeek 动了谁的奶酪?

“训练数据抄袭”:DeepSeek 动了谁的奶酪?

在上一篇的评论区里,大家发生了争吵: 《DeepSeek-V3 是怎么训练的|深度拆解》 有的读者指出:DeepSeek V3 有“训练数据抄袭”的问题。

来自主题: AI资讯
6157 点击    2024-12-31 12:49
DeepSeek V3“报错家门”:我是ChatGPT

DeepSeek V3“报错家门”:我是ChatGPT

DeepSeek V3“报错家门”:我是ChatGPT

要说这两天大模型圈的顶流话题,那绝对是非DeepSeek V3莫属了。 不过在网友们纷纷测试之际,有个bug也成了热议的焦点—— 只是少了一个问号,DeepSeek V3竟然称自己是ChatGPT。

来自主题: AI资讯
6935 点击    2024-12-29 17:47
国产之光DeepSeek把AI大佬全炸出来了!671B大模型训练只需此前算力1/10,细节全公开

国产之光DeepSeek把AI大佬全炸出来了!671B大模型训练只需此前算力1/10,细节全公开

国产之光DeepSeek把AI大佬全炸出来了!671B大模型训练只需此前算力1/10,细节全公开

DeepSeek新版模型正式发布,技术大佬们都转疯了! 延续便宜大碗特点的基础之上,DeepSeek V3发布即完全开源,直接用了53页论文把训练细节和盘托出的那种。

来自主题: AI技术研报
6719 点击    2024-12-28 11:19